.人 臣 甘 日 二 || 


个 hinaV i 全 人 T 
CNINAIVEDTF 雪 TY 


应 用 认 文 


蒙古 文 音乐 领域 的 语义 检索 初探 


鲍 玉 来 ” 毕 强 ? 
!( 内 蒙古 大 学 图 书馆 
(吉林 大 学 管理 学 院 


呼和浩特 010021) 
长 春 130022) 


摘要 : 【 目的 ] 在 蒙古 文 信息 资源 急剧 增长 的 背景 下 ,探索 将 基于 本 体 的 语义 检索 应 用 到 蒙古 文 领域 , 提高 蒙古 
文 信息 资源 检索 效果 。[ 方法 ] 利用 本 体 技术 重视 推理 、 互 联 的 优势 ,借助 语义 解析 与 推理 工具 Jena 的 规则 推理 
引擎 ,设计 并 实现 了 基于 蒙古 文 音乐 领域 本 体 的 蒙古 文 语义 检索 系统 。[ 结果 】 相 较 于 关键 词 匹配 检索 , 语义 检 
索 系 统 查 全 率 达 到 95.6%、 查 准 率 达 到 93.2%， 明 显 高 于 关键 词 匹配 检索 。[ 局 限 ] 仅 以 蒙古 族 多 声 部 音乐 为 研 
究 对 象 ， 实验 对 象 数据 有 限 ,检索 具有 一 定 的 局 限 性 。[ 结论 ] 对 基于 蒙古 文 领域 本 体 的 语义 检索 进行 了 完整 的 
研究 , 为 蒙古 文 语义 网 应 用 研究 打下 良好 的 理论 和 技术 基础 。 


关键 词 : 蒙古 文 领域 本 体 
分 类 号 : TP182 ”G353 


语义 推理 ”语义 检索 


1 3 引 


互联 网 发 展 有 两 种 明显 的 趋势 : 信息 资源 的 语义 
化 ; 用 户 与 信息 资源 的 多 语言 化 "1。 其实， 当前 不 仅 英 
语 、 汉 语 、 俄 语 等 语言 网 络 信息 资源 在 急剧 增长 ， 随 
着 中 国 少数 民族 文献 信息 资源 建设 的 推进 , 各 类 少数 
民族 语言 的 网 络 信息 资源 也 在 飞速 增加 ,尤其 是 传统 
蒙古 语 (简称 蒙古 文 ) 信 息 资 源 建 设 经 过 几 十 年 的 艰苦 
努力 , 从 无 到 有 , 取得 了 令 人 瞩目 的 成 就 。 如 内 蒙古 蒙古 
文 报 网 联盟 平台 、 耶 理 巴 蒙古 文 文献 管理 系统 外、 蒙 
文 期 刊 网 时、 中 国 蒙 古 学 信息 网 外 等 。 此 外 ， 内 蒙古 大 
学 图 书馆 参加 了 “中 美 百 万 册 数 字 图 书馆 合作 计划 ” 
共 完 成 了 6 000 余 种 蒙古 文 现 代 图 书 数字 化 , 建立 了 
“蒙古 文 资源 全 文 数据 库 ”。 在 此 背景 下 ,如 何 高 效 地 
获取 有 价值 的 蒙古 文 信息 资源 ,为 蒙古 文 用 户 提供 更 
有 效 的 检索 服务 , 成 为 当下 蒙古 文 信息 资源 数字 化 建 
设 或 竺 解决 的 难题 。 

传统 蒙古 语 属于 阿尔 泰语 系 ， 主 要 使 用 者 分 布 在 
中 国内 蒙古 自治 区 、 辽 宁 省 、 黑 龙 江 省 、 吉 林 省 、 甘 
肃 省 、 青 海 省 、 新 疆 维吾尔 自治 区 等 地 区 , 是 中 国 少 


了 


数 民 族 语 言 中 使 用 范围 、 社 会 影响 及 国际 知名 度 比较 
广泛 的 语种 四。 蒙古 文 有 34 个 字母 ， 其 中 包含 7 个 元 
音字 母 和 27 个 辅音 字母 。 蒙 古文 的 拼写 是 以 词 为 单位 
竖 写 , 一 个 词 内 字母 连 着 写 , 词 之 间 用 空格 分 开 ， 总 
的 书写 规则 是 从 上 到 下 连 写 ， 从 左 到 右 移行 。 蒙 古文 
的 每 个 字母 在 字 首 、 字 中 、 字 尾 有 不 同 的 变 体 ; 有 的 
变 体 有 多 种 形式 ， 导 致 这 些 变 体 字母 的 书写 形式 不 一 
致 , 存在 一 字 多 形 、 多 字 同 形 、 形 同音 不 同 的 现象 。 
此 外 ,蒙古 文中 有 一 套 非常 复杂 而 严密 的 正字 法 规则 
和 语法 规则 外 所 有 的 这 些 特 点 导致 它 不 能 按 字母 读 
音 检索 ,以 至 于 蒙古 文 被 称 为 最 难 检索 的 文字 之 一 。 

随 着 语义 网 的 提出 , 本 体 成 为 语义 网 新 的 研究 方 
向 和 热点 。 国 内 研究 人 员 对 语义 网 的 探索 主要 集中 在 
本 体 构建 和 语义 检索 两 方面 , 构建 了 一 些 具有 推理 能 
力 的 系统 。Li 等 四 提出 一 种 基于 描述 逻辑 的 组 合 推理 
方法 。Huang 等 提出 利用 语义 相似 度 计 算 获 得 粗糙 
本 体 中 的 隐藏 信息 , 实现 了 关联 信息 的 挖掘 。 备 红 伟 
等 [通过 对 文献 领域 本 体 中 的 重要 概念 进行 语义 标注 
和 语义 相似 度 计算 , 提高 文献 检索 的 准确 度 。 周 群芳 
等 设计 一 个 基于 Jena 推理 和 Lucene 框架 的 专利 语 
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义 检索 系统 ,提高 了 专利 检索 的 效率 。 武 俊 丽 "在 研 
究 中 先 分 析 了 传统 信息 检索 方式 的 不 足 之 处 , 利用 本 
体 的 结构 特点 ， 对 语义 标注 技术 进行 分 析 研 究 , 构建 
适用 于 计算 机 领域 期 刊 文献 的 检索 系统 。 李 兵 1 构建 
适用 于 专利 领域 的 语义 检索 系统 , 通过 语义 推理 达到 
提高 查 准 率 的 目的 。 在 蒙古 语 语义 Web 研究 中 , 苏 依 
拉 等 1 利用 本 体 知识 , 建立 了 一 个 蒙古 文 的 内 蒙古 自 
治 区 的 小 型 地 名 本 体 词 表 , 方便 有 关 地 理 信息 的 语义 
检索 ; 此 外 苏 依 拉 等 中 还 通过 构建 “人 工 智能 (WwW wt 
ed) "课程 蒙古 文 领域 本 体 ,， 并 对 检索 的 知识 点 进行 
语义 相似 度 计算 , 构建 适用 于 蒙古 文教 学 领域 的 学 习 
系统 。 塔 娜 等 [以 跨 语言 信息 检索 需求 为 背景 ,利用 构 
建 领域 本 体 的 方法 给 出 蒙 汉 双语 计算 机 术语 语义 词典 
的 初步 设计 方法 ,从 整体 上 来 看 , 蒙古 文 语义 Web 研究 
相对 于 汉语 语义 Web 研究 , 还 处 于 相对 薄弱 的 阶段 。 

因此 本 文 引入 语义 Web 技术 , 选取 蒙古 族 音 乐 代 
表 性 的 多 声 部 音乐 潮 尔 和 马头琴 为 本 体 研 究 对 象 , 重 
点 探讨 适用 于 蒙古 文 音乐 领域 本 体 的 推理 规则 , 构建 
基于 蒙古 语音 乐 领域 的 语义 检索 原型 系统 ， 并 实现 该 
系统 ,为 蒙古 文 语义 Web 的 应 用 研究 葛 定 一 定 的 基础 ， 
进一步 丰富 语义 网 的 研究 领域 和 内 容 。 


2 ”蒙古 文 音乐 领域 本 体 构 建 


目前 比较 成 熟 的 本 体 构建 方法 有 TOVE 法 [7、 
IDEF-5 法 呈 、 骨 架 法 0 、 七 步 法 PC 等 。 本 文 借鉴 “七 
步 法 ?和 “骨架 法 ”的 主要 步 又 ,结合 Methontology 法 、 
IDEF-5 法 的 特点 , 根据 “蒙古 文 音乐 "领域 本 体 构建 实 
际 情况 , 确定 本 文 的 构建 思路 和 流程 ， 如 图 1 所 示 。 

本 体 研究 缺少 对 中 文 ， 特别 是 少数 民族 语言 的 支 
持 。 基 于 蒙古 文 音乐 领域 的 本 体 构建 方法 研究 ,验证 
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| 古本 体 的 颌 碟 和 


考察 可 复 用 本 体 


| 获取 领域 中 重要 概念 和 术语 


rz| 定义 领域 核心 概念 及 概念 之 间 的 关系 


构建 本 体 (定义 类 和 属性 ) 


本 体 确 认 与 评价 


图 1 和 蒙古 文 音乐 领域 本 体 构 建 流程 


完整 性 、 可 扩展 性 等 构建 规则 进行 确认 。 在 进化 环节 ， 
根据 本 体 的 可 扩展 性 、 灵 活性 的 特点 , 特别 是 蒙古 文 
存在 一 字 多 形 和 一 词 多 义 现象 , 在 蒙古 音乐 本 体 构建 
初期 , 一 些 概 念 之 间 的 关系 可 能 不 是 很 明确 。N 表示 
还 可 以 对 蒙古 音乐 本 体 数据 进行 维护 和 完善 .Y 表示 之 
前 构建 的 蒙古 音乐 本 体 没有 问题 , 可 以 完成 本 体 建 库 。 
2.1 蒙古 文 音乐 重要 术语 和 概念 获取 

通过 蒙古 文 期 刊 网 和 中 国 知 网 选取 一 定量 关于 蒙 
古文 音乐 湖 尔 和 马头琴 的 学 术 论文 , 利用 基于 层 登 隐 
马尔 可 夫 模 型 的 蒙古 语词 切 分 系统 "对 这 些 数据 进行 
预 处 理 , 取得 数据 中 的 蒙古 音乐 术语 概念 的 字 词 集合 ; 
按照 最 具 蒙 古 族 音 乐 领域 代表 性 的 原则 , 选取 关键 蒙 


了 蒙古 文 领域 本 体 构 建 技 术 的 可 行 性 。 有 利于 建立 蒙 
古文 数字 资源 知识 组 织 , 进一步 丰富 蒙古 文 信息 处 理 
和 语义 网 领域 的 研究 内 容 。 本 文 的 研究 对 象 是 具有 蒙 
古 族 传统 音乐 代表 性 的 潮 尔 和 马头琴 音乐 。 本 体 的 共 
享 特性 使 本 体 模 型 中 的 数据 能 够 实现 重用 ， 而 蒙古 文 
音乐 领域 现在 还 未 找到 可 以 重用 的 本 体 数据 。 通 过 领 
域 专家 、 相 关 文 献 书籍 等 收集 蒙古 音乐 潮 尔 和 马头琴 
领域 的 术语 和 概念 知识 ， 并 确定 核心 概念 之 间 的 关 
系 。 使 用 Protégé 构建 本 体 模 型 。 本 研究 中 的 蒙古 文 音 
乐 领域 本 体 可 根据 其 概念 定义 的 清晰 性 、 一 致 性 、 


古音 乐 的 术语 概念 如 下 : 

蒙古 族 多 声 部 音乐 (tm wevevver ww 全 /fs erp6 
ef) 、 潮 尔 (mv 、 冒 顿 潮 尔 (sw/ mw0) 、 托 布 秀 尔 (se 、 
浩 林 潮 尔 (tx wy me0) 、 潮 尔 哆 (met ve) 、 胡 尔 (mr0)、 
多 声 部 (eV fs 9me) 、 持 续 低 音声 部 (ewtrb "my mo 
mt) 、 持 续 低 音声 部 为 乐器 演奏 (ev or om 
mepwhy et)、 旋 律 声 部 (www mmf mw ee)、 旋 律 声 部 
为 乐器 演奏 (wy em ae 、 旋 律 部 分 长 调 
(rw py erm fn ery 6) 潮 尔 类 乐器 (mr wy sw/ 
ex、 叶 克 勒 (< 、 海 拉克 森 潮 尔 (smy me0) 、 潮 尔 音 
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乐 文化 语 境 (mw eew wy wy wwV)、 地 域 环境 (gr 
yb my sp)、 生 存 语 境 (ren8 etn6 my sm )、 
潮 尔 音乐 源流 (me evww rw Ww Ya 、 早 期 潮 尔 音乐 现 
象 (way we Bl my ta) 、 自 然 音 响 (eraw m6)、 表 
演 形式 (erem ex) 、 可 单 人 表演 (tr=y Grey m vim)、 
多 人 表演 (my eey mm mem) 、 音 乐 结构 (me Qi ry 
ever/) 、 人 声 + 人 声 ((meK (key in so) 十 qi (Qi 
mf))、 人 声 + 乐 器 (fo (Grey on/) 十 Gy wy em 、 乐 
器 + 乐器 (GW ww mr + Gr or em 发展 和 流行 分 布 
(key inf wm tor me/)、 新 疆 蒙古 族 留存 的 冒 顿 潮 尔 
(km io fr pay rmi gw) jn/ ze) 、 科 尔 沁 蒙 
古人 的 传统 乐器 海 拉 克 森 (qrry fro aey rr fi 
ev Nty zt) 、 锡 林 郭 勒 地 区 流行 的 潮 尔 哆 (sw gm 
Try 8 im/ rt ov6) 、 马 头 琴 (rw 0)、 三 种 定 弦 法 
(rey wm am pmp rw)、 正 四 度 定 弦 法 (ve say 
GawW im min +) 、 正 五 度 定 弦 法 (wa 9&/ 
Ge yn qi nm)、 反 四 度 定 纺 法 (wmar8 smtV 
Ga py 0m qt ny) 、 五 种 演奏 法 (eV wy era 
wy))、 潮 尔 定 弦 胡 尔 演奏 法 (zf TY 6 orm ff 
Ge my)) 、 潮 尔 定 弦 或 黑 力 定 嘴 厄 鲁 特 演奏 法 
(st 0 mn 06 NG 0 mm thio tion 
Gatef yw) 、 察 哈 尔 定 弦 泛 音 演 奏 法 (> em rw ww 
wiK Great my) 、 博 尔 赤 斤 定 弦 泛 音 演 奏 法 (eV 
fg wy TO mw Goren ww)、 博 尔 赤 斤 定 弦 图 布尔 演 
奏 法 (wy em wy ow areg rw)、 流 行 分 布 (mw 
9%mie/) 、 内 蒙古 (we pr) 、 辽 宁 (em) 、 吉 林 (sV) 、 黑 
龙 江 (efeV) .甘肃 (6) 新疆 (mm) 代表 人 物 (eeokx 
ee/) 、 巴 拉 贡 (eVy) 、 布 林 巴 雅 尔 (evere) 、 桑 都 仍 
(saram) 、 色 拉 西 (kw 、 经 典 作 品 (ge se) 、 太 仆 
寺 阿 斯 尔 (vatv rw) 、 平 魔 记 (frw w sy ww) 、 美 丽 
富 侯 的 阿拉 善 (wo fm wwW) 、 色 润 赛 罕 杭 盖 (py 
mm)、 走 马 (wt) Int)、 鄂 尔 多 斯 的 春天 (ws wy en 
等 概念 。 
2.2 ”蒙古 文 音 乐 本 体 概念 类 层次 关系 的 建立 

类 用 于 描述 抽象 的 实体 对 象 , 代表 着 一 类 具有 共 
同 特性 的 实例 对 象 。 类 具有 继承 性 并 以 层次 结构 的 形 
式 组 织 , 最 顶层 的 类 代表 着 最 抽象 的 实体 概念 , 子 类 
继承 了 父 类 的 抽象 特性 , 代表 比 其 父 类 更 具体 或 范围 
更 小 的 实体 概念 。 

通过 查阅 相关 文献 , 本 文 使 用 自 底 向 上 的 方法 ， 
明确 概念 集中 的 每 一 个 概念 知识 的 含义 。 分 析 概 念 之 


ll 


呈 注 现代 图 书 情报 技术 


间 潜 在 的 显 性 关系 和 隐 性 关系 。 蒙 古 族 多 声 部 音乐 潮 
尔 和 马头琴 领域 中 核心 术语 概念 是 在 蒙古 文 音乐 基础 
上 建立 起 来 的 ,它们 的 从 属 关系 已 经 体现 了 概念 的 分 
层 结构 ， 如 图 2 和 图 3 所 示 : 


Class hierarchy: Thing 四 日 国 加 
日 
了 - 厌 TIhing 


一 生境 尔 赤 斤 定 引 泛 音 演 卖 法 
一 剧 罕 哈 尔 定 弦 流 音 演奏 法 
一 属 湖 尔 定 芝 或 黑 力 定 弦 尼 特 演奏 法 
… 居 淹 尔 定 综 胡 尔 演奏 法 
广 -个 三 种 定 弦 法 
下 -者 莹 古 族 多 声 部 音乐 
广 -局 淹 尔 音乐 结构 
广 - 章 淹 尔 表演 形 二 
请 “个 淹 尔 音 乐 源流 
天 必 湖 尔 音乐 文化 语 境 
>- 必 湖 尔 类 乐器 
上 人意 谋 律 声 部 
了 -便条 声 部 
一 全 持续 低音 声 部 刘 乐 跨 演奏 
者 持续 低音 声 郭 


图 3 ”Protégé 中 对 应 汉语 概念 类 的 层次 关系 
2.3 ”蒙古 文 音乐 本 体 类 和 属性 的 定义 

本 体 表示 的 具体 过 程 就 是 定义 类 和 属性 。 在 本 体 
模型 中 , 属性 表示 不 同 概念 (类 ) 之 间 的 关系 , 也 显示 
了 不 同 概念 类 之 间 的 差异 , 在 本 体 建 模 工 具 Protégé 中 
主要 包括 对 象 属性 和 数据 属性 。 对 象 属性 的 作用 是 明 
确 不 同 概念 类 之 间 的 关系 。 数 据 属性 的 作用 是 描述 概 
念 类 具有 的 数据 。 通 过 定义 属性 区 分 了 不 同 概念 类 ， 
同时 也 避免 了 重复 定义 概念 类 , 有 利于 对 不 同 概念 类 
进行 描述 和 归纳 ,逐步 形成 知识 层次 结构 : 

蒙古 族 多 声 部 音乐 : { 潮 尔 ,马头琴 } 


: { 冒 顿 潮 尔 ， 托 布 秀 尔 ， 浩 林 潮 尔 ， 潮 尔 哆 ， 胡 尔 } 
部 : { 持 续 低音 声 部 ,持续 低音 声 部 为 乐器 演奏 } 
部 : {人 声 旋律 声 部 ， 旋 律 声 部 为 乐器 演奏 ， 旋律 


声 
} 

潮 尔 类 乐器 : { 叶 克 勒 ， 海 拉克 森 潮 尔 } 

潮 尔 音 

潮 尔 音乐 源流 : {早期 潮 尔 音乐 现象 ， 自 然 音 响 } 

表演 形 


音乐 结构 : {人 声 + 人 声 ， 人 声 + 乐器 ,乐器 + 乐器 } 

发 展 和 流行 分 布 : {新 疆 蒙 古 族 留存 的 冒 顿 潮 尔 ， 科 尔 
沁 蒙 古人 的 传统 乐器 海 拉 克 森 潮 尔 , 锡林郭勒 地 区 流行 的 
潮 尔 哆 } 

马头琴 三 种 定 纺 法 : {正四 度 定 蓄 法 ， 正 五 度 定 弦 法 , 反 
四 度 定 弦 法 } 

马头琴 五 种 演奏 法 : { 潮 尔 定 弦 胡 尔 演奏 法 , 潮 尔 定 弦 
或 黑 力 定 弦 厄 鲁 特 演奏 法 ， 察 哈 尔 定 弦 泛音 演奏 法 , 博 尔 赤 
斤 定 弦 泛音 演奏 法 , 博 尔 赤 斤 定 弦 图 布尔 演奏 法 } 

流行 分 布 : {内 蒙古 ， 辽宁， 吉林， 黑龙江， 甘肃， 新 疆 } 

代表 人 物 : { 巴 拉 贡 , 布 林 巴 雅 尔 ， 桑 都 仍 ， 色 拉 西 } 

经 典 作品 : { 太 什 寺 阿 斯 尔 , 平 魔 记 ,美丽 富饶 的 阿拉 
善 ， 色 润 赛 罕 杭 盖 , 走马 ， 鄂尔多斯 的 春天 } 

为 了 更 好 地 描述 本 体 概 念 之 间 的 关系 ,新 增 对 象 属性 
Depend( 依 赖 ), Depended( 被 依赖 ), Use( 使 用 ), Used( 被 使 用 )。 
2.4 添加 实例 

在 Protégé 中 的 Individuals 面板 中 添加 类 的 实例 
(个 体 ), 给 这 个 实例 中 各 个 属性 的 赋值 ， 完 成 蒙古 音 
乐 领域 本 体 的 构建 ， 如 图 4 所 示 : 


fes | Bots Propertes | Annotaton Properies | ndvauas OWiViz | DL Ouey | OntoGrat | SPAROLOuery | Ontology Differences | 
ea pe mse| i 


i 


?3 EE 


图 4 ”Protégé 中 添加 实例 面板 


2.5 ”蒙古 文 音乐 本 体 语 义 推理 

本 文 使 用 开源 Java 框架 Jenat 作为 推理 工具 , 实 
现 蒙 古文 音乐 领域 内 的 概念 知识 的 语义 推理 。 

Jena 框架 自身 包含 RETE 和 Tabled Datalog 两 个 
规则 推理 引擎 ,它们 能 够 实现 三 种 推理 模型 。 本 文采 
用 规则 推理 实现 语义 推理 。 规 则 推理 ,是 指 把 相关 领 
域 的 专家 知识 形式 化 地 描述 出 来 , 形成 系统 规则 。 这 
些 规则 表示 该 领域 的 一 些 问题 与 这 些 问 题 相 应 的 答 
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案 , 可 以 利用 它们 模仿 专家 在 求解 中 的 关联 推理 能 
力 。 制 定 推理 规则 时 要 紧密 遵循 本 体 的 实际 应 用 , 主 
要 研究 的 领域 是 蒙古 文 音乐 , 所 以 推理 规则 需要 根据 
蒙古 文 音乐 领域 本 体 和 检索 需求 进行 制定 。 在 本 文中 
推理 规则 制定 如 下 : 

(1) 本 体 模型 中 概念 间 的 层级 结构 和 类 的 继承 性 
具有 异曲同工 之 处 , 在 本 体 概念 中 类 的 继承 性 主要 表 
现 为 子 类 概念 继承 父 类 的 特性 , 子 类 概念 同时 也 有 父 
类 概念 类 所 没有 的 属性 , 继承 推理 规则 如 下 : 

Rulel: (?a, rdfs:subClassOf, ?b), (2?s, rdfs:type, ?a)->(?s, rdfs: 


type, ?b) 

如 果 a 是 b 的 子 类 且 s 属于 a 的 某 个 实例 或 者 属 
性 , 则 s 也 属于 的 某 个 实例 或 者 属性 。 

(2) 本 体 中 有 时 会 存在 两 个 具有 相同 属性 值 却 名 
称 不 同 的 概念 类 , 而 且 有 时 候 它 们 表示 相同 知识 点 的 
概念 类 , 对 于 这 一 类 本 体 推理 规则 如 下 : 

Rule2: (?a, owl:equivalentClass, ?b), (?s, rdf:type, ?a)->(?s, 

rdf:type, 2b) 


Rule3: (?a, owl:equivalentClass, ?b), (2s ,rdf:type, ?b)->(?s, 
rdf:type, ?a) 


名 称 不 同 但 却 表示 同一 知识 点 的 概念 类 a 和 b 具 
有 相同 的 属性 值 。 
(3) 有 包含 关系 的 本 体 类 , 推理 规则 如 下 : 


Rule4:(?a,rdfs:subClassOf,?b), (?b,rdfs:subClassOf,?c)->(?a, rdfs: 
subClassOf, ?c) 


概念 类 a、b、c 形成 面向 对 象 中 类 的 继承 关系 ,a 
的 属性 由 c 继承 而 来 , 同时 a 也 包含 c 所 没有 的 属性 。 
(4) 音乐 概念 存在 相互 依赖 和 平行 的 关系 ,推理 
规则 如 下 : 
Rule5: (2f depended ?a), (?f depended ?b) ->(?a paralel ?b) 
概念 类 a 和 b 同时 依赖 于 f 则 它们 互 为 平行 概念 。 
(5) 音乐 中 的 不 同 概念 在 使 用 时 存在 关联 性 ,， 推 
理 规则 如 下 : 
Rule6: (2a used ?b), notEqual (7?a,?b) ->(2a reference ?b) 
检索 概念 a 时 会 用 到 概念 b 的 相关 信息 , 上 且 a 和 
表示 不 同 概念 , 则 a 和 b 具有 关联 关系 。 


3 ”蒙古 文 音乐 语义 检索 系统 实现 


本 系统 是 基于 蒙古 文 音乐 领域 本 体 的 语义 检索 系 
统 , 利用 本 体 的 推理 技术 对 查询 关键 词 进行 语义 扩展 ， 
通过 基于 推理 规则 的 语义 推理 技术 获得 本 体 数 据 中 的 
隐藏 关联 信息 ， 从 而 实现 蒙古 文 音乐 领域 语义 检索 原 
型 系统 。 


天 
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3.1 系统 架构 

根据 系统 的 功能 性 需求 分 析 , 参考 主流 的 Web 搜 
索引 擎 的 架构 方式 ,结合 语义 Web 和 本 体 推理 技术 , 设 
计 语 义 检索 系统 模型 ， 检 索 对 象 为 蒙古 文 音乐 领域 的 
相关 概念 知识 。 采 用 浏览 器 /服务 器 ( 即 B/S 结构 ) 的 架 
构 方 式 ， 由 浏览 器 客户 端 ，WebAPP 服务 器 端 (Tomcat) 
和 DB 端 ( 存 储 领 域 本 体 文件 ) 构 成 三 层 架 构 体 系 。 

系统 实现 的 技术 路 线 : 使 用 RichFaces 框架 完成 


检索 请 求 


查询 预 处 理 
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系统 与 用 户 交 互 , 包括 系统 查询 检索 界面 和 结果 反馈 
界面 。 借 助 基于 Jena 框架 设计 的 JavaBean 推理 中 间 
件 , 完成 对 查询 关键 词 (检索 条 件 ) 的 语义 解析 和 查询 
范围 扩展 , 使 用 推理 引擎 和 推理 规则 完成 推理 过 程 ， 
调用 本 体 数 据 与 本 体 模型 中 的 数据 进行 匹配 , 输出 查 
询 结 果 。 通过 Protégé 构建 蒙古 文 音乐 领域 本 体 , 借助 
Jena 实现 持久 化 存储 ,制定 适合 蒙古 文 音乐 领域 的 推 
理 规则 。 系 统 的 整体 架构 设计 如 图 5 所 示 : 


pra Bann : 尔 、 马 头 
推理 规则 文件 琴 相 关 文 献 


本 体 建 模 I 获取 数据 


蒙 音 4 蒙古 文 音乐 
sd 领域 概念 


图 5 蒙古 文 音乐 语义 检索 系统 架构 


3.2 ”语义 检索 流程 

(1) 系统 通过 检索 界面 得 到 用 户 输入 的 查询 关键 
词 ， 通 过 检索 条 件 可 以 将 查询 范围 限制 在 本 体 知识 库 
中 的 概念 类 、 属 性 、 实 例 等 ， 从 而 明确 检索 需求 。 

(2) 在 检索 请 求 提交 后 ,系统 会 根据 输入 的 检索 
词 进行 相应 的 语义 扩展 ,， 并且 根据 推理 规则 得 出 与 原 
查询 词 相近 或 相似 的 查询 词 集合 , 在 语义 层面 上 实现 
查询 范围 的 扩展 。 

(3) 将 原 有 信息 和 推理 出 来 的 隐 含 信息 结合 起 来 ， 
形成 推理 后 的 完整 数据 库 。 

(4) 再 将 用 户 的 查询 请 求 在 经 过 推理 的 数据 库 中 
进行 信息 匹配 , 获取 有 用 的 信息 。 

(5) 将 最 终 查 询 结 果 以 条 理 清晰 、 便 于 用 户 识 别 
和 使 用 的 形式 反馈 给 用 户 。 

本 系统 的 检索 流程 如 图 6 所 示 。 
3.3 ”系统 验证 

在 系统 没有 使 用 语义 推理 功能 的 情况 下 , 输入 
“蒙古 族 多 声 部 音乐 ”这 一 概念 进行 检索 时 , 检索 效果 
如 图 7 所 示 。 系 统 反 馈 的 结果 集中 包含 了 蒙古 族 多 声 


部 音乐 的 典型 代表 “ 潮 尔 "、“ 潮 尔 表 演 形 式 " 和 “音乐 结 
构 ” 等 概念 知识 。 


卫 现代 图 书 情报 技术 


语义 推理 
仆 模块 
1 1 


| 提交 检索 


全 | | 和 
1 1 

| 

| 


返回 检索 结 


图 6 语义 检索 时 序 图 


图 7 蒙古 文 音乐 语义 检索 效果 
系统 使 用 了 语义 推理 功能 的 情况 下 ,再 次 输入 
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“蒙古 族 多 声 部 音乐 "这 一 概念 进行 检索 , 经 过 语义 推 
理 后 的 检索 效果 如 图 8 所 示 。 在 系统 返回 的 结果 集中 
不 仅 包含 “ 潮 尔 ”等 相关 概念 ,而 且 包 括 潮 尔 的 具体 种 
类 ， 如 “ 浩 林 漳 尔 "、“ 冒 顿 潮 尔 ” 等 概念 ,以 及 多 声 部 译 
乐 的 一 些 表演 属性 , 如“ 单 人 表演 ”“ 人 声 + 乐 器 ”等 更 
详细 的 概念 知识 。 


证 


sy 


yy 
Im 
east 
ee A 地 四 
ty Ei pe i 
CY TT ey 


YA ee 由 
py ep es 


Te 


ry rg sir 
PAP YY es so 


erp ap gs 
PP ee pe oan 
ee MV 六 ee gavtuev 
A EY hy oa 
we ee rn sa 
TENY TY Se 
as Sy gr 


图 8 经 过 语义 推理 后 的 检索 效果 


通过 对 150 篇 蒙古 文 音乐 领域 文献 检索 测试 显示 ， 
语义 检索 系统 查 全 率 达 到 95.6% 、 查 准 率 达到 93.2%， 
明显 高 于 关键 词 匹 配 检索 ( 查 全 率 75.2%， 查 准 率 
73.6%)。 


4 结 语 


本 文 虽然 只 是 以 蒙古 文 多 声 部 音乐 为 研究 对 象 ， 
但 是 对 基于 蒙古 文 领域 本 体 的 语义 检索 进行 了 完整 的 
研究 。 由 于 传统 的 基于 关键 字 的 检索 引擎 在 检索 蒙古 
文 信息 资源 时 存在 诸多 不 足 , 本 文 利用 本 体 实现 了 基 
于 蒙古 文 音乐 领域 的 蒙古 文 语 义 检索 系统 , 在 一 定 程 
度 上 提升 了 蒙古 文 信 息 资 源 检索 的 效果 , 为 蒙古 文 语 
义 网 应 用 研究 打下 了 很 好 的 理论 和 技术 基础 ， 具 有 很 
好 的 可 推广 性 。 
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Semantic Retrieval for Mongolian Music: An 上 xplorative Study 


Bao Yulail” BiQiang” 
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Abstract: [Objective] This paper aims to Improve the retrieval performance of the booming Mongolian information 
resources with Ontology based semantic technology. [Methods] We designed a semantic retrieval System with the help 
of Mongolian music domain Ontology as well as the semantic analysis and inference engine Jena. [Results] Compared 
to the keyword matching retrieval systems, the recall and precision of the proposed system were significantly improved 
(95.6% and 93.2%, respectively). [Limitations] The experimental data only included the Mongolian multi-voice music. 
[Conclusions] The proposed semantic retrieval system lays theoretical and technological foundations for the research of 
Mongolian semantic Web applications. 
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